سامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالبهای معنایی
Authors
Abstract:
رفع ابهام معنایی از کلمات در بافت یکی از مهمترین چالشها در حوزۀ پردازش زبان طبیعی و زبانشناسی رایانشی است. در این میان حروف اضافه، بهخصوص در زبان فارسی، در پژوهشهای مربوط به رفع ابهام معنایی همواره نادیده انگاشته شدهاند. ازاینرو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالبهای معنایی، سامانهای قاعدهمند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فارسی ارائه دهد. روش به کار گرفتهشده در این پژوهش و الگوریتم پیشنهادی منحصربهفرد است. دادگان مورداستفاده در این پژوهش شامل 1000 جمله دادۀ آموزشی، 100 جمله دادۀ توسعه و 500 جمله دادۀ تست است که از منابع اینترنتی و شبکههای اجتماعی همچون یوتیوب جمعآوری گردیده است. جهت انجام کار، تمام حروف اضافه موردنظر پژوهش برچسبدهی معنایی شده و برای آنها در پیکرۀ آموزشی، قالبهای معنایی بر اساس زبان قالب بنیاد مینسکی (1975) تعریف شدند. همچنین برای کلمات قبل و بعد حروف اضافه در پیکره نیز قالبهایی تهیه و در فایل داده مدخلها وارد سامانه گردیدند. الگوریتم پژوهش در سه مسیر با استفاده از اطلاعات موجود در قالبها، اقدام به تعیین معنای حروف اضافه در جملات میکند. نتایج آزمایشهای دادۀ تست، نشان دهندۀ دقت بالای عملکرد سامانه (16/99%) در رفع ابهام معنایی از حروف اضافه در زبان فارسی است.
similar resources
رفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA
Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...
full textرفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی lda
ابهام زدایی از واژگان مبهم و دارای معانی متعدد موضوع مهمی در حوزه ی پردازش زبان های طبیعی می باشد. در این مقاله، مدلی برای رفع ابهام از واژگان مبهم فارسی بر اساس استخراج ویژگی های جدید پیشنهاد شده است. برای ایجاد این مدل دو دسته ویژگی واژگان و نشانه های همراه واژه مبهم و ویژگی هایی که با بکار بردن روش های مدل سازی موضوع بدست می آید، استفاده شده است. یک مدل موضوعی، مدلی آماری برای استخراج چکیده ...
full textبررسی معنایی و دسته بندی حروف اضافه زبان فارسی بر پایه نظریه لیبر
لیبر (2004 & 2009) نظریه ای تجزیه مدار با هفت مؤلفۀ معنایی و یک اصل به نام اصل هم نمایگی ارائه کرده است. در این نظریه هر عنصر زبانی یک اسکلت معنایی و یک بدنۀ معنایی دارد. اسکلت از یک یا چند مؤلّفه معنایی و یک یا چند موضوع ساخته می شود. بدنۀ معنایی دو لایه دارد: 1. لایه ای که مانند اسکلت از یک گویشور به گویشوری دیگر نسبتاً ثبات دارد و می توان آن را نشان داد؛ 2. لایه ای که اطلاعاتِ کلی و دانش فرهنگ ...
full textنقشهای معنایی حرف اضافة «از» در زبان فارسی
زبان به مانند موجودی زنده در طی زمان، دستخوش تغییر و تحوّلات میگردد و بررسی ویژگیهای آن در صورت کنونی بدون در نظر گرفتن تغییرات درزمانی، پژوهشی ناقص و نارساست. در این مقاله، نقشهای معنایی حرف اضافة «از» در زبانهای اوستایی، فارسی باستان، فارسی میانه، پارتی، فارسی دری و فارسی امروز، با استفاده از دادههای دستور این زبانها و نیز واژهنامههای هر یک بررسیشدهاست. «از» در زبان اوستایی و فارسی ...
full textکارکردهای معنایی و دستوریِ حرف اضافۀ «از» در زبان فارسی
با آنکه حروفاضافه به طبقۀ بستهای از واژهها تعلق دارند، اما چندمعنا بودنِ آنها سبب میشود تا کارکردهای معنایی و دستوریِ آنها متنوع باشد. این پژوهش با رویکردی پیکرهبنیاد به بررسیِ توصیفیِ کارکردهای دستوری و معناییِ حرف اضافۀ «از» در زبان فارسی پرداختهاست. برای این منظور، «پیکرۀ گزارههای معنایی زبان فارسی» مورداستفاده قرار گرفته است. در این پیکره که حجمی بالغ بر سی هزار جمله دارد و روابط محمول-مو...
full textMy Resources
Journal title
volume 9 issue 1
pages 99- 117
publication date 2018-06-22
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023